
DATA SCIENTIST | Titre RNCP niveau 7 - Bac +5 | Co-certifiée école MINES Paris - PSL
Le Data Scientist métier le plus sexy du 21 eme siecle, traite les données et élabore des modèles prédictifs.
En suivant ce cursus, vous aurez toutes les clefs pour y parvenir. Les compétences nécessaires en Python, DataViz, mais également Machine Learning Deep Learing ou Artificial intelligence. Un programme exhaustif qui fera de vous un Data scientist opérationnel et à l'aise avec toutes les technologiques utilisées sur le marché.
Informations pratiques:
- Parcours de formation Hybride mêlant sessions de coaching en visio conférence et autoformation sur notre plateforme full saas prete à coder.
- Nos professeurs sont également concepteur du programme pour garantir une cohérence et un suivi homogène tout au long du parcours.
- Des séances de coaching personnelle sont disponible chaque semaine pour les apprenants
- Chaque module est sanctionné un examen, corrigé à la main, pour validation
- Un projet fil-rouge, que vous allez devoir établir à partir de rien, représente environ 1/3 du temps alloué à votre formation: chaque semaine un point sera fait avec votre responsable de cohorte pour gérer l’avancement et la bonne compréhension des méthodes à mettre en pratique
Quelques compétences acquise à l’issue de la formation:
- Étudier les données de l’entreprise qui permettront de définir celles qui seront extraites et traitées
- Récupérer et analyser des données pertinentes liées au processus de production de l’entreprise, à la vente ou encore liées aux données clients
- Élaborer des modèles prédictifs afin d’anticiper l’évolution des données et tendances relatives à l’activité de l’entreprise
- Modéliser des résultats d’analyse des données pour les rendre lisibles et exploitables par les managers
Divisé en 8 blocs, le cursus de Data Scientist, accessible en format intensif de 11 semaines ou continu de 9 mois, saura apporter toutes les connaissances et compétences nécessaires au métier sous-jacent.
1. Introduction à Python
Fondamentaux de python
- Découverte des différentes variables, listes et Tuples
- Présentation des divers opérateurs et structures de contrôle
- Initiation au concept de boucles et ses différents types
- Introduction aux fonctions et leurs documentations
- Instanciation de classes et utilisation de modules
NumPy
- Création et manipulation d'un Numpy Array
- Présentation des opérations matricielles et manipulation d'un Numpy Array
- Création d'un indicateur statistique et opérations sur le Numpy Array
Pandas
- Introduction à la bibliothèques Pandas
- Chargement et première exploration d'un jeu de données
- Introduction au Data Cleaning
- Introduction au Data Processing
2. Data Visualisation
Matplotlib
- Présentation de différents types de graphes:
- Courbe
- Graphique
- Nuage de points
- Histogrammes
- Introduction à la personnalisation de graphiques
Seaborn
- Maîtrise de l'analyse de distribution
- Mise en place de l'analyse statistique
- Initiation à l'analyse multivariée
Bokeh
- Formation à tous types de graphiques interactifs et intégrables sur page Web
- Visualisation de données géographiques
- Découverte des Widgets et création
3. Machine learning supervisé
Classification simple de modèles
- Introduction à SciKit Learn
- Présentation de la Classification SVM
- Application de la méthode K-Nearest neighbors
Classification simple de modèles
- Sélection de modèles
- Classification semi-supervisée
4. Machine Learning Non-supervisé
Méthode de Clustering
- Présentation des algorithmes K-moyenne
- Découvertes des algorithmes de mean shift
Méthode de Régression
- Introduction à la régression linéaire simple et multiple
- Introduction à la régression linéaire régularisée
Méthode de réduction de dimension
- Feature selection process
- Initiation aux analyses en composantes principales
- Application de l'approche Manifold Learning
5. Machine Learning Avancé
Séries temporelles avec Statsmodels
- Découverte des modèles de base
- Découverte des modèles ARIMA
Text mining
- Introduction aux expressions régulières
- Gestion de données textuelles
- Création d'un WorldCloud
Machine Learning et théorie des graphes avec Network X
- Introduction à la théorie des graphes
- Application des algorithmes fondamentaux: Krustal et Dijkstra
- Détection de communautés
- Application de l'algorithme PageRank au classement de page Web
6. Big Data / Database
Introduction au Data Engineering et Big Data
- Introduction aux 3V du Big Data
- Présentation des bases de données et architectures
- Mise en production de données
Data Processing et Machine Learning sur des grandes bases de données avec PySpark
- Introduction à PySpark
- Découverte des différentes fonctions de PySpark:
- Data Processing
- Data Frames
- Regression avec PySpark
- ML pipelines
- Model Turning
7. Deep Learning
Deep Learning avec le framework Keras
- Découverte des concepts fondamentaux :
- Dense Neural Networks
- Convolutional Neural Networks
- Architecture LeNet
- Transfer Learning
Introduction à Tensorflow 2.0
- Mise en relation de Tensorlfow et Keras
- Application du Word Embedding avec Word2vec
- Présentation du Recurent Neural Network
- Présentation du Generative adversial Network
8. Système Complexe & IA
Reinforcement learning
- Définition des éléments de l'apprentissage par renforcement
- Mise au point sur les fondamentaux mathématiques pour le reinforcement learning
- Présentation de la principale famille d'algorithmes de reinforcement learning : Monte Carlo
- Application des algorithmes d'apprentissage par différence temporelle : SARSA
- Application des algorithmes d'apprentissage par différence temporelle : Q-Learning
- Comparaison entre Temporal Difference Learning et Monte Carlo
Deep reinforcement learning
- Introduction au Deep Reinforcement Learning
- Compréhension des fondements des méthodes basées sur la valeur
- Compréhension des problèmes de variances élevés, des risques de surestimations et application des méthodes de résolution
- Introduction à la méthode de Policy Gradient
- Compréhension des principes fondamentaux de la structure Acteur-Critique utilisée dans l'apprentissage en Deep Reinforcement Learning
- Application à des Business Cases
+ Le projet fil-rouge
Formation diplômante
inscrite au RNCP
Financement facilité
CPF, OPCA, etc.
Professeur dédié
5 jours sur 7
Financement
Des solutions de financement pour vous aider
À propos du centre DATASCIENTEST
Leader français de la formation en Data Science, DataScientest offre un apprentissage d’excellence orienté emploi pour professionnels et particuliers.
Notre dispositif joui de plusieurs avantages qui expliquent ce succès:
Un système d’apprentissage hybride innovant:
Notre formation repose sur un dispositif reposant à la fois sur une plateforme full Saas de E-Learning et un accompagnement personnalisé de cours et coaching en distanciel (depuis la crise sanitaire). Le rapport est d’environ 85% et 15%. Ceci permet d’allier la flexibilité et rigueur qui assure un taux de satisfaction de 94% et de complétion de 99%.
Deux options de rythme:
Une formation en format Bootcamp, intensive sur une base de 35h par semaine idéale pour les reconversion et une formation continue d’environ 5/7h par semaine qui permet de conjuguer formation et projets professionnels ou personnels.Des professeurs-concepteurs maître de leurs disciplines:
Tous nos professeurs, issus des meilleures écoles d’ingénieur (Polytechnique, Centrale…), travaillent à temps plein pour DataScientest à la fois dans la conception de nouvelles formations, dans le coaching personnel des apprenants, la R&D… Nous ne ferons jamais appel à des prestataires externes pour une meilleure maîtrise des sujets abordés.
Ce dispositif explique qu’en l’espace de quatre ans, plus de 35 entreprises du CAC40 et de nombreux autres champions français et étrangers nous ont déjà fait confiance pour former quelque 1500 professionnels. Entre temps, et depuis le lancement de notre offre pour particuliers il y a un an, environ 2 cohortes sont lancées tous les mois.
Nous proposons trois formations aux data sciences aux prérequis plus ou moins exigeant: Data Analyst, Data Scientist, Data Engineer, toutes éligibles à une certification de l’Université Panthéon Sorbonne et de l'école MINES ParisTech.
Parce que c'est vous qui en parlez le mieux
Envie d’en savoir plus sur cette formation ?
Documentez-vous sur la formation


